2. 가설 설정 및 이유
1) 동사의 차이
시나리오보다 소설에서 동사의 사용이 더 빈번할 것이다.
영상으로 만들어진다는 것을 전제로 쓰여진 것이다. 그렇기 때문에 배우들의 행동을 지문으로 제시한다. 하지만 오히려 영상으로 만들어지는 것이기 때문에 상황 설명이나 묘사가 소설에 비해 자세하지
주제 선정 이유 및 목적
소설은 시대에 상관없이 대중에게 사랑받는 문학 장르
각색되어 영화로 만들어지기도 함 (영화의 대본→ 시나리오)
소설과 시나리오의 차이
분석 대상 : 이청준의 소설 ‘벌레이야기’와 영화 ‘밀양’
이청준의 ‘벌레이야기’는 1985년도에 발표된 단편소설
Ⅰ. 원시 코퍼스와 주석 코퍼스
원시 코퍼스(raw corpus)
출판된 형태 그대로의 텍스트를 전자형태로 모아 놓은 것
주석 코퍼스(annotated corpus)
텍스트를 어떤 목적을 위하여 가공하고 표지를 붙여 놓은 것
주석의 목적
어떤 목적을 위하여 텍스트를 해석하고 그 해석한 결과를 표시해
3) 70, 80년대 음악보다 90, 00, 10년대 음악이 단순한 여흥어의 반복이 많을 것이다.
70, 80년대의 음악에서는 우리말을 이용해서 단순 명료하게 자신의 감정을 표현했지만, 90년대 이후의 음악에서는 자신의 감정을 표현하는 것 이외에 노래를 듣는 사람들의 흥을 돋우기 위한 의미없는 음절의 반복이 많다
Ⅰ. 국어 품사 접미사의 특징
1. 어기에 대한 의존성
접미사는 의존명사에 비해 어기에 대해 의존성을 지닌다. 이것은 의존명사는 부분적이나마 자립성을 인정할 수 있기 때문이다. 따라서 이 기준은 의존명사와 접미사를 구별하는 주된 기준으로 사용되며, 어근과 접미사를 구별하는 기준은 되지
이러한 코퍼스의 텍스트는 모두가 語料를 분리하여, 품사태깅 등을 한 후에 사용하게 되는 것이다. 따라서 단어 자동 분리는 가장 기본적인 작업인 셈이다.
3. 중국어 문헌의 자동 처리는 우선 단어 분리를 해야만, 단어 의미, 통사 구조 등 좀더 깊이 있는 언어 지식이 활용될 수 있게 되기 때문이다
(태깅, 파싱)
한국어의 특징
전자사전의 구현
PROGRAM
자연 언어를 이용한 검색 프로그램
P R E S E N T A T I O N
자연 언어
자연 언어 처리 (1)
자연 언어란?
인간이 일상적으로 사용하고 있는 언어
인간이 가진 가장 자연스러운 정보전달 방법
자연언어 처리의 필요성
실용상의 필요성
학술상의 필요성
품사)을 하며 어떻게 표현(다의미)되어야 하는지를 결정하는 문제가 어려운 부분으로 대두된다. 따라서 다의미, 다품사의 용이한 처리에 있어서 기계번역은 그 한계를 여실히 드러내게 된다. 즉, 이런 다의미 다품사의 정의가 문장에 따라 명확해지면 자연어 번역의 영역에 쉽게 들어가게 되는 것이다.
품사 태거’를, 후자에는 SynKDP(Synthesized Korean Data Processor), 즉 ‘깜짝새’를 사용하였다.
1.3. 텍스트 구축 : 인터넷 곳곳에서 수집하였다. 소설 말뭉치에는 김동인의 <감자>를 비롯한 14편의 한국 현대소설이 있고 신문기사 말뭉치에는 조선일보, 한겨레신문, 중앙일보, 동아일보, 경향신문의 기사들을